配套阅读:《RAG系列01—NaiveRAG》《RAG系列02—AdvancedRAG》《从NaiveRAG到AgenticRAG》引言:那个"if-else套了11层"的RAG项目2024年底,我帮一家金融科技公司做 RAG系统的codereview。 (仅当sufficient=false)"""七、决策框架:何时停在Modular,何时升级Agentic7.1应该停留在ModularRAG的场景场景理由多源异构数据但问题模式可枚举Modular的DAG 项目,Modular就是终点。 那很可能就是Modular该出场的信号。你能不能画出当前RAG系统的完整模块图?如果不能在一张A4纸上画清楚——你的架构其实并不存在,只是代码在跑。你最近一次新增数据源花了多久?
——朱熹 https://www.modular.com/ 在linux中运行 curl -s https://get.modular.com | sh - MAX 提供了一个统一且可扩展的平台
长文预警,今天介绍一个时间序列管理系统的论文:《ModelarDB: Modular Model-Based Time Series Management with Spark and Cassandra
Modular Inverse Time Limit: 2 Seconds Memory Limit: 65536 KB The modular modular multiplicative
题意 求a关于m的乘法逆元 分析 a x ≡ 1 (mod m) 等价于 ax+my=1 求x的最小正数(不能是0,我就WA在这里了)。 gcd(a,m)!=1 时x不存在。 所以用扩展gcd就可以求了。 代码 #include<cstdio> #define ll long long ll exgcd(ll a,ll b,ll &x,ll &y) { if(b==0) { x=1; y=0; return a; } ll r
左图是未来5年,CXL服务器出货量占比预测,2025年达到3%,2027年将进入快车道,随后快速增长;
RAG通过将检索与生成相结合,不仅提升了模型的实时性,还显著提高了生成内容的准确性和深度。 然而,RAG技术并非一成不变。 从最初的朴素RAG(Naive RAG)到如今的高级RAG(Advanced RAG)和模块化RAG(Modular RAG),这一技术经历了多次迭代和优化。 本文三桥君将深入探讨RAG技术的演进路径,分析其在不同阶段的技术原理、应用场景以及未来发展方向。 二、朴素RAG:技术探索的起点 1. 用户需求驱动 方式 效果 引入用户反馈机制 根据用户反馈不断优化生成内容,提升用户满意度 六、总结 从朴素RAG到模块化RAG,RAG技术的演进不仅展示了AI技术在检索与生成领域的巨大潜力,也揭示了技术背后的复杂细节和挑战 而模块化RAG则通过模块化设计和灵活组合,将RAG技术推向了新的高度,使其能够应对更加复杂和多样化的应用场景。
RAG 2.3.1 来源 Modular RAG 最早由 Yunfan Gao 等人在 2024 年 7 月的论文《Modular RAG: Transforming RAG Systems Orchestration是Modular RAG区分Advanced RAG的一个重要部分,而Memory模块虽然在原论文没有提及,但笔者认为也是Modular RAG的一个重要组成部分,用于赋予RAG Modular Rag 举个例子 1、代码示例,使用haystack官方示例。 《Modular RAG and RAG Flow: Part Ⅰ》 - https://medium.com/@OpenRAG/modular-rag-and-rag-flow-part-%E2% 85%B0-e69b32dc13a3 《Modular RAG and RAG Flow: Part II》 - https://medium.com/@OpenRAG/modular-rag-and-rag-flow-part-ii
数据管理系统中的分析查询处理性能主要取决于系统的查询优化器的能力。数据量的增加和对处理复杂分析查询的兴趣的增加促使Pivotal构建了一个新的查询优化器。
当前,所有形状都可以移动和旋转,但这并不是它们唯一能做的。我们可以想出一些希望形状表现出来的不同行为。要使形状做其他事情,只需将其代码添加到Shape.GameUpdate中即可。但是,如果我们定义很多行为的话,那么该方法将变得非常庞大。另外,我们可能不希望所有形状的表现都相同。
like Naive RAG, Advanced RAG, and Modular RAG (Gao et al., 2023). ) and system modularity (Modular RAG). Modular RAG The latest paradigm, Modular RAG, decomposes RAG into independent, reconfigurable components Modular RAG Modular RAG represents a paradigm shift, decomposing the RAG pipeline into reusable, configurable Modular and Reconfigurable Architectures The complexity of RAG systems has spurred interest in modular
02、RAG 的发展 从近年 RAG 的发展历程看,RAG 主要经历了 Naive RAG、Advanced RAG、Modular RAG、Graph RAG,以及最近热门的 Agentic RAG Modular RAG 代表了主流 RAG 的工程化实现。 Graph RAG 利用图检索能力,让 RAG 增强 multi-hop 检索和丰富上下文。 2.3 Modular RAG Modular RAG 是当前主流的 RAG 系统设计,将检索和生成分解为独立可复用的组件,从而实现特定域的优化和任务适应性。 Modular RAG 将 RAG 系统所使用到的多种检索、存储、路由等等全部模块化,并且可以根据特定的场景,对这些模块进行重新排列,如多种检索方式的混合检索等,以取得更好的效果。 重写- reranking - 更准确的检索- 增强检索相关性 Modular RAG - 混合检索- 工具、API集成- 模块化、工程化的实现 - 更强的灵活性- 适应更多元的场景 Graph RAG
可以设置queryTransformers来进行查询转换Modular RAGSpring AI受Modular RAG: Transforming RAG Systems into LEGO-like Reconfigurable Frameworks启发实现了Modular RAG,主要分为如下几个阶段:Pre-Retrieval、Retrieval、Post-Retrieval、GenerationPre-Retrieval Sequential RAG Flows(Naive RAG、Advanced RAG),另外Spring AI受Modular RAG: Transforming RAG Systems into LEGO-like Reconfigurable Frameworks启发实现了Modular RAG,主要分为如下几个阶段:Pre-Retrieval、Retrieval、Post-Retrieval、Generation docRetrieval Augmented GenerationModular RAG: Transforming RAG Systems into LEGO-like Reconfigurable
一个具有更大上下文窗口的新模型问世,社交媒体上便会充斥着“RAG 已死”的宣言。 RAG 的初衷 五年前,我在 Meta 基础人工智能研究中心(FAIR,前身为 Facebook 人工智能研究中心)的团队提出了 RAG(Retrieval-Augmented Generation,检索增强生成 底线是:您同时需要长上下文 LLM 和 RAG。 但既然“RAG”这个术语似乎如此具有争议性,那我们不妨这样说: 我们不必非得称之为 RAG。 我们可以就叫它 检索 (retrieval)。 RAG 提供了相当于直接翻到相关页面的能力。处理更多 token 不仅更慢,而且极其低效,并且比使用 RAG 精准定位所需信息要昂贵得多。 RAG、微调和大型上下文窗口在 AI 中也是如此。 结论 我们不需要在 RAG 与长上下文窗口、微调或 MCP 之间做出选择。
J - Modular Inverse ZOJ - 3609 The modular modular multiplicative inverse of an integer a modulo m
【RAG】001-RAG概述 0、整体思维导图 下面的知识是基于一个视频教程结合 AI 生成的笔记,我也看了一遍,有了一些印象,但这种印象很快就会消失,知识也就消失了,为了使得知识在我的大脑中停留更长的时间 补充1:RAG 基本逻辑 补充2:RAG 知识库基本逻辑 一、RAG 介绍 1、LLM 的主要局限性 大语言模型(LLM)尽管功能强大,但仍存在以下明显的局限性: 时效性问题:模型的知识在预训练后就固定了 概述 1、RAG 的概念 RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了检索和生成技术的文本处理方法,主要用于提高语言模型的输出质量。 2、RAG 的工作原理 RAG 的核心工作流程包含以下步骤: 知识库构建: 收集和处理文档资料 将文档切分为适当大小的文本块 使用向量化模型将文本转换为向量并存储 检索过程: 接收用户查询并向量化 在向量数据库中搜索相似内容 获取最相关的文本片段 生成过程: 将检索到的相关内容与用户问题组合 构建合适的提示词(Prompt) 通过 LLM 生成最终答案 3、RAG 的应用场景 RAG 技术在多个领域都有广泛应用
配套阅读:《RAG系列01—NaiveRAG》《从NaiveRAG到AgenticRAG》引言:2025年3月,我参加了一家toBSaaS公司的技术评审会。那天的议题是"RAG系统下一阶段升级路线"。 应该停留在AdvancedRAG的场景场景理由单一数据源(仅文档库)不需要路由多种检索器问题模式可枚举(<20种)静态pipeline够用用户量<10000/日没必要分流延迟敏感(P99<2s)Modular Modular和Agentic是为剩下20%准备的。 8.2应该升级Modular的信号满足任意两条:数据源≥3个异构源(文档+SQL+KG+API)可枚举出≥4类query,每类最优pipeline不同需要在模块级别做A/B测试AdvancedRAG已稳定运行 如果这三个问题有一个回答不上来,所有关于Modular和Agentic的讨论都是空中楼阁。
系列说明:这是RAG工程化系列第一篇,目标是把四代RAG(NaiveAdvancedModular/Agentic)逐一拆透。每篇聚焦一种范式,讲它真正能做什么、做不到什么、工程上怎么落地。 一、NaiveRAG到底是什么:先把定义讲清楚,否则后面全是糊涂账打开任何一篇RAG教程,你会看到几乎一样的描述:"RAG就是先检索再生成"。这种描述等于没说。 但这一行决定了你的RAG准确率上限。PDF是NaiveRAG的头号杀手。 这一段代码能解决RAG项目里50%的"幻觉投诉"。零模型成本、立竿见影。 留给读者的两个问题:你正在做的RAG项目,8颗雷里你已经踩了几颗?
RAG技术全面解析:原理、应用与优势 引言 在当今快速发展的人工智能领域,检索增强生成(Retrieval-Augmented Generation, RAG)技术已成为一个备受关注的话题。 RAG工作流程 RAG的工作流程可以分为以下几个步骤: 用户查询:用户提出一个查询,系统首先会将这个查询传递给检索模型。 RAG技术的应用场景 RAG技术在众多实际应用场景中显示出其独特的优势,这是其他单一技术难以比拟的。下面我们详细探讨RAG技术的几个主要应用场景。 RAG技术可以在知识图谱构建过程中发挥重要作用。通过利用检索模型从大规模文档库中找到最新的相关信息,RAG系统可以识别出新的实体和关系。 RAG技术的优势与挑战 RAG技术在很多方面展示了其显著的优势,但它也面临着一些挑战。以下我们将详细探讨RAG技术的优势和挑战。
您听说过 RAG Logger 吗? 它是一款专为检索增强生成 (RAG) 应用程序设计的开源日志记录工具! 据说它可以作为 LangSmith 的轻量级替代方案,满足 RAG 特定的日志记录需求。 查询、搜索结果、LLM 交互和性能指标可以以 JSON 格式记录。 特点 通过查询跟踪详细了解用户问题! RAG Logger 为 RAG 应用程序的性能监控和调试提供了强大的支持,对吗? 特别推荐给那些想要提高应用程序开发效率的人。 请参阅此处的详细信息: RAG Logger GitHub 仓库